Inciso 3A

Column

Estadísticas descriptivas

Data summary
Name select_if(aux1, is.numeri…
Number of rows 500
Number of columns 5
_______________________
Column type frequency:
numeric 5
________________________
Group variables None

Variable type: numeric

skim_variable n_missing complete_rate mean sd p0 p25 p50 p75 p100 hist
AvgSessionLength 0 1 33.05 0.99 29.53 32.34 33.08 33.71 36.14 ▁▃▇▆▁
TimeonApp 0 1 12.05 0.99 8.51 11.39 11.98 12.75 15.13 ▁▃▇▅▁
TimeonWebsite 0 1 37.06 1.01 33.91 36.35 37.07 37.72 40.01 ▁▃▇▅▁
LengthofMembership 0 1 3.53 1.00 0.27 2.93 3.53 4.13 6.92 ▁▃▇▃▁
YearlyAmountSpent 0 1 499.31 79.31 256.67 445.04 498.89 549.31 765.52 ▁▅▇▃▁

Column

Interpretación estadísticas descriptivas

AvgSessionLength (Duración promedio de la sesión) La duración de las sesiones de los usuarios tiene una media y mediana de 33.1 minutos, con una desviación estándar de 0.99, lo que indica que las sesiones son relativamente homogéneas. El valor mínimo registrado es de 29.5 minutos y el máximo de 36.1 minutos, con un rango total de 6.61 minutos y un rango intercuartílico (IQR) de 1.37 minutos, lo que muestra baja dispersión en los datos. La asimetría de -0.0321 sugiere que la distribución es prácticamente simétrica, sin una inclinación significativa hacia valores altos o bajos. La curtosis de 3.00 indica que la forma de la distribución es muy similar a una normal, con una dispersión de datos dentro de los rangos esperados.

Time on App (Tiempo en la aplicación) El tiempo que los usuarios pasan en la aplicación tiene una media de 12.1 minutos y una mediana de 12.0 minutos, con una desviación estándar de 0.99, lo que indica que la variabilidad en el tiempo de uso es baja. El valor mínimo registrado es de 8.51 minutos y el máximo de 15.1 minutos, con un rango total de 6.62 minutos y un rango intercuartílico (IQR) de 1.37 minutos, mostrando que la mayoría de los usuarios tienen tiempos de uso muy similares. La asimetría de -0.0889 sugiere una ligera inclinación hacia valores más bajos, aunque no de manera significativa. La curtosis de 3.11 indica que la distribución es ligeramente más concentrada en la media en comparación con una distribución normal, lo que implica que los tiempos de uso están menos dispersos.

Time on Website (Tiempo en el sitio web) El tiempo de navegación en el sitio web tiene una media y mediana de 37.1 minutos, con una desviación estándar de 1.01, lo que sugiere que los usuarios pasan un tiempo relativamente estable en la plataforma. El tiempo mínimo registrado es de 33.9 minutos y el máximo de 40.0 minutos, con un rango total de 6.09 minutos y un rango intercuartílico (IQR) de 1.37 minutos, lo que indica que el 50% de los usuarios pasan entre 36.3 y 37.7 minutos en la web. La asimetría de 0.0121 muestra que la distribución es prácticamente simétrica, sin sesgos hacia valores altos o bajos. La curtosis de 2.89 indica que la distribución es ligeramente más plana que una normal, sugiriendo una menor concentración de valores en la media y una dispersión algo mayor.

Length of Membership (Duración de la membresía) El tiempo que los clientes han sido miembros de la plataforma tiene una media de 3.53 años y una mediana de 3.53 años, con una desviación estándar de 0.99, lo que indica que la mayoría de los clientes tienen tiempos de membresía similares. El valor mínimo registrado es de 0.27 años y el máximo de 6.92 años, con un rango total de 6.65 años y un rango intercuartílico (IQR) de 1.20 años, lo que significa que el 50% de los clientes tienen entre 2.93 y 4.13 años de membresía. La asimetría de -0.106 sugiere una leve inclinación hacia clientes con más años en la plataforma, mientras que la curtosis de 3.33 indica una ligera mayor concentración en la media, con pocos valores extremos.

Yearly Amount Spent (Cantidad anual gastada) El gasto anual de los clientes presenta una media de 499.3 dólares y una mediana de 499.0 dólares, con una desviación estándar de 79.3, lo que indica una mayor variabilidad en comparación con las otras variables. El gasto mínimo registrado es de 257.0 dólares y el máximo de 766.0 dólares, con un rango total de 508.8 dólares y un rango intercuartílico (IQR) de 104.3 dólares, mostrando que el 50% de los clientes gastan entre 445.0 y 549.0 dólares al año. La asimetría de 0.0347 indica que la distribución es casi perfectamente simétrica, mientras que la curtosis de 3.45 sugiere la presencia de algunos valores extremos, lo que podría representar clientes con patrones de gasto significativamente más altos que el promedio.

Inciso 4

Column

Gráficos univariados

Gráficos bivariados con “Yearly Amount Spent”

Column

Interpretación gráficos univariados

AvgSessionLength (Minutos promedio de la sesión de asesoría): El atributo tiene una distribución aparentemente simétrica con un ligero peak central, lo que indicaría que posiblemente tenga una distribución cercana a la norma. En cuanto a los valores están aproximadamente entre 30 y 36 minutos, lo que demuestra que existe poca variabilidad de los datos, la mayoría de los clientes tienen sesiones de entre 33 y 34 minutos de asesoría, lo que muestra que este proceso al parecer está estandarizado.

TimeOnApp (Minutos totales en la app): En este caso se ve una distribución simétrica, posiblemente con una distribución normal, con valores entre 8 y 15 minutos aproximadamente. Se observa que los usuarios de la app pasan en promedio entre 11 y 13 minutos en la aplicación. El rango de los datos en este caso es pequeño, lo que indica que el tiempo en la app es consistente entre los clientes, sin mayor variación.

TimeOnWebsite (Minutos totales en el sitio web): La distribución al igaul que los atributos anteriores es simétrica, posiblemente normal, con un ligero sesgo positivo (cola derecha más larga). Los minutos totales en el sitio web van entre los 34 y 40 minutos, destacando que la mayoría de los usuariospasan entre 36 y 38 minutos en la web. Se aprecia una mayor dispersión en comparación con el tiempo en la app, lo que podría indicar que algunos usuarios exploran más el sitio web que otros, podria deberse a que la app es complementaria y funciona más como consulta, mientras que la web está enfocada en un uso más intensivo con posiblemnete más opciones, pero es solo una suposición.

LengthOfMembership (Años de membresía en la tienda): Se puede apreciar una distribución simétrica con una ligera concentración central, en la que el rango de años de membresía en la tienda es de 0 a 6 años con una mayoría clara de clientes con una antiguedad de 3 a 4 años como miembros. Esto podria sugerir una alta retensión después de los primeros años de membresía.

YearlyAmountSpent (Monto anual de compras en dólares): En cuanto a la distribución es simétrica, posiblemente normal, con un rango de valores entre 300 y 800 dólares. La mayoría de los clientes gastan entre 400 y 600 dólares al año en compras, no se ve una diferenciación entre la app y la web pero habría sido interesante analizarlo. Se aprecia una variabilidad moderada, lo que sugiere diferencias en los hábitos de consumo entre clientes.

Interpretación gráficos bivariados

Inciso 5

Column

Gráfico de “AvgSessionGroup”

Descripción de “AvgSessionGroup”

Column

Interpretación estadísticas descriptivas y gráfico de “AvgSessionGroup”

Inciso 6

Column

Boxplot de la variable “Yearly Amount Spentr” por categoría

Column

Interpretación del Boxplot de la variable “Yearly Amount Spentr”

Inciso 7

Column

Matriz de las correlaciones

Gráficos bivariados con “Yearly Amount Spent”

Column

Columna Interpretación

Inciso 7B

Column

Matriz de las correlaciones

Heatmap de correlación

Inciso 7C

Column

Matriz de las correlaciones

Gráficos bivariados con “Yearly Amount Spent”

Column

Columna Interpretación

Inciso 8

Column

summary(modelo) - R2.train & R2.valid


Call:
lm(formula = YearlyAmountSpent ~ AvgSessionLength + TimeonApp + 
    TimeonWebsite + LengthofMembership, data = aux1, subset = train)

Residuals:
     Min       1Q   Median       3Q      Max 
-30.2617  -6.3368  -0.3456   6.8310  30.1189 

Coefficients:
                     Estimate Std. Error t value Pr(>|t|)    
(Intercept)        -1044.0993    24.9478 -41.851   <2e-16 ***
AvgSessionLength      25.5468     0.4951  51.595   <2e-16 ***
TimeonApp             38.9498     0.5073  76.775   <2e-16 ***
TimeonWebsite          0.3445     0.4871   0.707     0.48    
LengthofMembership    61.3558     0.5000 122.719   <2e-16 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 9.922 on 395 degrees of freedom
Multiple R-squared:  0.9839,    Adjusted R-squared:  0.9837 
F-statistic:  6034 on 4 and 395 DF,  p-value: < 2.2e-16
[1] 0.9838982
[1] 0.9851772

Column

Ajuste en ambas muestras